NVIDIA Quadro RTX 4000 评测

2024-07-07 11:20| 来源: 网络整理| 查看: 265

去年 4000 月发布的 Quadro RTX 4000 是 NVIDIA 专业 GPU 系列的一部分。 RTX XNUMX 专为 CAD 软件专业人士设计，可提供强烈的真实感和与其设计的沉浸式交互。因此，这使他们能够在本地工作站上运行高级模拟和分析。

与其他 NVIDIA GPU 不同，RTX 4000 使用 NVIDIA Quadro 可扩展视觉解决方案 (SVS)。因此，每个单独的 RTX 4000 卡最多可以支持四个 5Hz 的 60K 显示器，或双 8K 显示器。当使用两个 Quadro Sync II 板时，一个系统最多可支持八个 RTX 4000 GPU，同步 32 个独立显示器。 NVIDIA 还声称带宽比上一代 Quadro P40 提高了 4000%，这在一定程度上要归功于 8GB 的 GDDR6 显存。

RTX 4000 采用 4.4” H x 9.5” L 单槽外形，使 GPU 能够适应各种工作站机箱。在这种纤薄的外形中，NVIDIA 能够容纳 2304 个 CUDA 内核、288 个 Tensor 内核、36 个 RT 内核和 8GB GDDR6 内存。该硬件专为密集的 AEC、DCC、AI、VR 和图形工作负载而设计。 RTX 4000 配备 VirtualLink，可简化与下一代高分辨率 VR 头戴式显示器的连接。

Quadro RTX 4000 规格建筑英伟达图灵 GPU内存 8GB GDDR6 存储器接口 256 bit 内存带宽高达 416GB/秒 NVIDIA CUDA核心 2,304 NVIDIA 张量核心 288 NVIDIA RT 核心 36 单精度性能 7.1 TFLOPS 张量性能 57.0 TFLOPS 系统介面 PCI Express 3.0 x 16 能量消耗总板功率：160W 显卡总功率：125W 热解决方案活跃外形 4.4” 高 x 9.5” 长，单槽最大同时显示 4x 3840×2160 @ 120 赫兹 4x 5120×2880 @ 60 赫兹 2x 7680×4320 @ 60赫兹 VR就绪有电图形 API 着色器型号5.1 OpenGL 4.5 DirectX 12.0的 Vulkan 1.0 计算 API CUDA 直接计算 OpenCL 性能

为了测试新架构在 NVIDIA Quadro RTX 4000 GPU 中的性能，我们将其安装在运行 Windows 920 的 Lenovo ThinkSystem P10 工作站中。为了全面了解每张卡的性能，我们利用了多项行业基准测试和 GPU 加速可以充分利用被测卡的软件。我们不仅将其与共享 Turning 架构的 NVIDIA Quadro RTX 5000 进行比较，还将与之前的 Pascal Quadro 系列进行比较，包括请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。是，请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。，并请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。. 对于所选择的 GPU，这更少，更好，更多。

为了更好地了解这些 GPU 如何从不同的架构扩展，我们提供了下表 RTX 的现状。 RTX 4000 显然是该系列中的入门级卡，P 系列卡从 P1000 开始。当然，RTX 系列一直扩展到 RTX 8000，带来了更多的显存、带宽和内核。

NVIDIA Quadro GPU RTX 4000 RTX 5000 RTX 6000 RTX 8000 GPU内存 8GB GDDR6 16GB GDDR6 24GB GDDR6 48GB GDDR6 存储器接口 256 bit 256 bit 384 bit 384 bit 内存带宽高达 416GB/秒高达 448GB/秒高达 672GB/秒高达 672GB/秒 NVIDIA CUDA核心 2,304 3,072 4,608 4,608 NVIDIA 张量核心 288 384 576 576 NVIDIA RT 核心 36 48 72 72 单精度性能 7.1 TFLOPS 11.2 TFLOPS 16.3 TFLOPS 16.3 TFLOPS 张量性能 57.0 TFLOPS 89.2 TFLOPS 130.5 TFLOPS 130.5 TFLOPS

我们的第一个基准测试是 LuxMark 跨平台 OpenCL 基准测试工具。 LuxMark 基于 LuxCore API，并作为 LuxCoreRender 套件的促销组件提供。它使用一个新的基于微内核的 OpenCL 路径跟踪器作为其基准测试的渲染器，提供了一种独特的方式来对给定工作站中安装的 GPU 施加压力。

勒克斯马克图形处理器成果请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 15,303 请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 13,170 请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 21,297 RTX 4000 28,338 RTX 5000 29,404

虽然 Pascal GPU 在 LuxMark 上取得了不错的成绩，但在观察 Turning GPU 时，性能有了明显的提升。 RTX 4000 以 5000 的成绩仅次于 RTX 28,338。

接下来是 Arion，这是一个 CUDA 基准测试工具，由 RandomControl 开发，允许工作站在渲染应用程序中对 CPU 或 GPU 施加压力。 ArionBench 是一款基于 Arion 2 技术的软件工具，它通过模拟 3D 场景中的光流任务使 CPU/GPU 承受重压。

阿里昂图形处理器成果请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 1,865 请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 2,738 请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 3,731 RTX 4000 4,484 RTX 5000 6,193

从 Pascal 到 Turing，RTX 4000 的分数又一次大幅跃升，比 P6000 有了相当大的跃升。

我们的下一个基准测试利用 SolidWorks 2019 和四个 3D 模型，包括奥迪 R8、建筑挖掘机、喷气发动机和拉力赛车。 Solidworks 是行业领先的 GPU 加速 3D CAD 建模应用程序，可在基于 Windows 的系统上运行。 SolidWorks 由 Dassault Systèmes 开发，全球有超过 165,000 万名工程师和超过 2019 家公司在使用它。出于基准测试目的，我们利用了 SolidWorks 4.5 中新的“性能管道”功能。该架构提供了响应速度更快的实时显示，尤其是对于大型模型。它利用现代 OpenGL (XNUMX) 和硬件加速渲染在您平移、缩放或旋转大型模型时保持高水平的细节和帧速率。

在渲染每个模型后，我们的脚本将每个模型旋转五次并测量完成此任务所需的时间。然后将其除以渲染的帧数，并计算每部分的平均帧数 (FPS) 分数。

SolidWorks的 SolidWorks R8 一般请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 198.0232 请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 214.9254 请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 217.9745 RTX 4000 211.1824 RTX 5000 208.8849 Solidworks 挖掘机一般请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 186.4832 请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 211.9595 请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 230.9774 RTX 4000 259.6056 RTX 5000 294.2529 Solidworks 喷气发动机一般请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 163.0573 请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 198.5351 请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 210.411 RTX 4000 220.6897 RTX 5000 283.2206 Solidworks 拉力赛车一般请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 205.6225 请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 219.0114 请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 218.4922 RTX 4000 214.4253 RTX 5000 217.256

使用 Solidworks R8 和 Rally Car 时，Turing 模型的性能略有下降，但 Digger 和 Jet Engine 有很大的提升。在我们的 Solidworks 测试中，我们使用了 beta 显示模式，这可能是 Audi R8 和 RallyCar 装配体上出现异常缩放的原因。

接下来是环境系统研究所 (Esri) 基准。 Esri 是地理信息系统 (GIS) 软件的供应商。 Esri 的性能团队设计了他们的 PerfTool 插件脚本来自动启动 ArcGIS Pro。此应用程序使用“ZoomToBookmarks”功能来浏览各种预定义的书签，并创建一个日志文件，其中包含预测用户体验所需的所有关键数据点。该脚本自动循环书签三次以说明缓存（内存和磁盘缓存）。换句话说，该基准模拟了人们可能通过 Esri 的 ArcGIS Pro 2.3 软件看到的大量图形使用。

测试由三个主要数据集组成。两个是宾夕法尼亚州费城和魁北克省蒙特利尔的 3-D 城市景观。这些城市视图包含覆盖在地形模型和覆盖航拍图像上的带纹理的 3-D 多面体建筑物。第三个数据集是俄勒冈州波特兰地区的二维地图视图。此数据包含有关道路、土地利用地块、公园和学校、河流、湖泊和山体阴影地形的详细信息。

查看蒙特利尔模型的绘制时间，NVIDIA Quadro RTX 4000 的平均绘制时间为 00:01:31.284，而平均和最小 FPS 分别显示为 502.395 和 180.699。

ESRI ArcGIS Pro 2.3 蒙特利尔抽奖时间一般 Quadro P4000 00:01:31.084 Quadro P5000 00：01：31：082 Quadro P6000 00:01:31.081 四核RTX 4000 00:01:31.284 四核RTX 5000 00:01:31.067 平均 FPS 一般 Quadro P4000 432.327 Quadro P5000 489.889 Quadro P6000 521.551 四核RTX 4000 502.395 四核RTX 5000 527.636 最低帧率一般 Quadro P4000 164.546 Quadro P5000 194.218 Quadro P6000 190.336 四核RTX 4000 180.699 四核RTX 5000 190.775

接下来是我们的费城模型，其中 RTX 4000 的平均绘图时间为 00:01:00.231，而平均和最小 FPS 分别显示为 434.170 和 196.825。

ESRI ArcGIS Pro 2.3 费城抽奖时间一般 Quadro P4000 00:02:53.928 Quadro P5000 00:01:01.109 Quadro P6000 00:01:01.245 四核RTX 4000 00:01:00.231 四核RTX 5000 00:01:01.111 平均 FPS 一般 Quadro P4000 304.340 Quadro P5000 451.826 Quadro P6000 469.879 四核RTX 4000 434.170 四核RTX 5000 531.315 最低帧率一般 Quadro P4000 160.152 Quadro P5000 212.910 Quadro P6000 207.879 四核RTX 4000 196.825 四核RTX 5000 224.341

我们的最后一个模型是波特兰。此处，RTX 4000 的平均绘制时间为 00:00:32.646。平均 FPS 显示为 2,821.928，而最低 FPS 显示为 1,083.260。

ESRI ArcGIS Pro 2.3 波特兰抽奖时间一般 Quadro P4000 00:00:32.426 Quadro P5000 00:00:32.310 Quadro P6000 00:00:32.552 四核RTX 4000 00:00:32.646 四核RTX 5000 00:00:32.541 平均 FPS 一般 Quadro P4000 2,051.053 Quadro P5000 2,057.395 Quadro P6000 2,343.948 四核RTX 4000 2,821.928 四核RTX 5000 2,783.547 最低帧率一般 Quadro P4000 1,179.974 Quadro P5000 1,189.524 Quadro P6000 1,282.045 四核RTX 4000 1,083.260 四核RTX 5000 1,007.309

结论

NVIDIA Quadro RTX 4000 是较低级别的图灵架构 GPU，但这并不意味着它不强大。 RTX 4000 配备 2304 个 CUDA 内核和 8GB GDDR6 GPU。与所有 Quadro RTX 一样，4000 能够在其易于访问的单插槽外形中提供加速的光线追踪、深度学习和高级着色。这可以让创意专业人士更快地获得洞察力，同时加快他们的创意工作。 RTX 4000 还配备了 VirtualLink，可简化与下一代高分辨率 VR 头戴式显示器的连接。

在性能方面，RTX 4000 表现非常出色，尤其是考虑到它处于新 GPU 的低端。在我们的 LuxMark 基准测试中，它几乎是 Pascal 基准的两倍，甚至超过了 P6000。在 Arion 中，RTX 4000 是 P4000 的两倍多，再次轻松超过 P6000。在我们的 Solidworks 基准测试中，RTX 4000 轻松超越了 P4000，并且在 Digger 和 Jet Engine 基准测试中表现更出色。在 ESRi 中，RTX 4000 的性能比 P4000（在某些情况下是 P5000）好得多，但在某些工作负载中，P6000 的性能更好。请记住，RTX 4000 处于 Turing 架构的低端，而 P6000 处于 Pascal 架构的高端。

总而言之，Quadro RTX 4000 是 NVIDIA 大量令人印象深刻的 GPU 产品线中广受欢迎的新成员，它为入门级显卡提供了令人印象深刻的性能数据，同时价格仅为 900 美元左右。

亚马逊上的 Quadro RTX 4000

Quadro RTX 4000 产品页面

讨论这篇评论

【本文地址】

公司简介

联系我们